TODOS
- Test de Fisher à mettre en place dans la partie fonction de production Translog (vs Cobb Douglas)
- Rendements d’échelle pour la quadratique avec \(\lambda\) très très bancal
- étude des VIF pour la translog form et du posterior predictive check
- Inclure aussi l’elasticité de substitution pour les fonctions de cost
- Changer l’écriture scientifique des labels des graphs vers une écriutre en millions (25M)
1 Imports et configuration
library(ggplot2)
library(dplyr)
library(tidyr)
library(gt)
library(tibble)
library(patchwork)
library(FactoMineR)
library(factoextra)
library(ggtext)
library(micEcon)
library(micEconSNQP)
library(micEconIndex)
library(micEconCES)
library(frontier)
library(ranger)
library(tuneRanger)
library(mlr)
library(rsample)
library(forcats)
library(performance)2 Description des données
Le jeu de données appleProdFr86 utilisé dans le papier d’économétrie de Ivaldi et al. (1996) comprend des données transversales de production de 140 producteurs de pommes français datant de l’année 1986.
apples <- readxl::read_excel("data/appleProdFr86.xlsx")| Colonnes | Description |
|---|---|
vCap |
Coûts associés au capital (foncier compris). |
vLab |
Coûts associés au travail (y compris la rémunération du travail familial non rémunéré). |
vMat |
Coûts des matières intermédiaires (plantations, engrais, pesticides, carburant, etc). |
qApples |
Indice de quantité des pommes produites. |
qOtherOut |
Indice de quantité de tous les autres outputs. |
qOut |
Indice de quantité de toute la production \(\Rightarrow 580000 \cdot (\text{qApples} + \text{qOtherOut})\) |
pCap |
Indice des prix du capital. |
pLab |
Indice des prix du travail. |
pMat |
Indice des prix des matières intermédiaires. |
pOut |
Indice des prix de la production globale. |
adv |
Distingue les producteurs qui sont conseillés par des laboratoires d’agronomie. |
2.1 Tableau descriptif
Ce tableau descriptif retrace les 10 premières observations et l’ensemble des variables associées dans le dataset.
| Producteurs de pommes 🍎 | ||||||||||||||
| 140 producteurs 🇫🇷 (1986) | ||||||||||||||
| \(N\) | Costs | Quantity Index | Price Index | \(adv\) | Factor Quantities | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| \(v_{Cap}\) | \(v_{Lab}\) | \(v_{Mat}\) | \(q_{Apples}\) | \(q_{OtherOut}\) | \(q_{Out}\) | \(p_{Cap}\) | \(p_{Lab}\) | \(p_{Mat}\) | \(p_{Out}\) | \(q_{Cap}\) | \(q_{Lab}\) | \(q_{Mat}\) | ||
| 1 | 220K | 320K | 300K | 1.4 | 0.98 | 1.4M | 2.6 | 0.90 | 8.9 | 0.66 | 84K | 360K | 34K | |
| 2 | 130K | 190K | 260K | 0.86 | 1.1 | 1.1M | 3.3 | 0.75 | 6.4 | 0.72 | 40K | 250K | 41K | |
| 3 | 81K | 130K | 91K | 3.3 | 0.40 | 2.2M | 2.2 | 0.96 | 3.7 | 0.94 | 37K | 140K | 24K | |
| 4 | 34K | 110K | 60K | 0.44 | 0.44 | 510K | 1.6 | 1.3 | 3.2 | 0.60 | 21K | 83K | 19K | |
| 5 | 39K | 84K | 100K | 1.8 | 0.015 | 1.1M | 0.87 | 0.94 | 7.2 | 0.83 | 45K | 89K | 14K | |
| 6 | 120K | 520K | 580K | 8.5 | 0.43 | 5.2M | 1.0 | 0.96 | 9.6 | 1.4 | 120K | 550K | 60K | |
| 7 | 89K | 170K | 340K | 4.1 | 3.3 | 4.3M | 0.98 | 1.0 | 7.8 | 1.3 | 91K | 170K | 44K | |
| 8 | 92K | 200K | 130K | 2.2 | 1.1 | 1.9M | 1.0 | 0.92 | 5.0 | 0.62 | 89K | 220K | 25K | |
| 9 | 66K | 180K | 190K | 1.8 | 2.6 | 2.5M | 2.5 | 1.0 | 5.6 | 1.9 | 27K | 180K | 34K | |
| 10 | 94K | 140K | 82K | 1.6 | 0.45 | 1.2M | 0.98 | 0.64 | 5.6 | 0.49 | 95K | 220K | 15K | |
Source: Ivaldi et al. (1996) |
||||||||||||||
3 Statistiques descriptives
3.1 Productivité moyenne des facteurs de production
La productivité moyenne (\(AP =\) Average Product) consiste à diviser la quantité totale d’output par la quantité totale de facteur utilisé (input) dans le processus de production.
Imaginons que les unités d’output sont des tonnes. Pour chaque input, cela revient en fait à expliquer combien de tonnes sont produites en moyenne par unité de capital, de travail et de matières intermédiaires en 1986 pour chaque producteur de pommes.
Nous obtenons alors respectivement :
\(AP_{Cap} = \frac{q_{Out}}{q_{Cap}}\)
\(AP_{Lab} = \frac{q_{Out}}{q_{Lab}}\)
\(AP_{Mat} = \frac{q_{Out}}{q_{Mat}}\)
apples <- apples |> mutate(
AP_Cap = qOut / qCap,
AP_Lab = qOut / qLab,
AP_Mat = qOut / qMat
)| Productivité Moyenne par Facteur 📋 | ||||
| Capital — Travail — Matériaux | ||||
| \(\min\) | \(\mu\) | \(\max\) | \(\sigma^2\) | |
|---|---|---|---|---|
\(AP_{Cap}\) |
1.45 | 32.64 | 152.87 | 29.25 |
\(AP_{Lab}\) |
0.86 | 10.21 | 25.63 | 6.20 |
\(AP_{Mat}\) |
8.22 | 90.64 | 301.43 | 60.43 |
Ce tableau, en plus des visualisations qui vont suivre, permet d’établir que les productivités moyennes par facteur sont très différentes selon les producteurs. De plus, on s’aperçoit aussi qu’investir dans un facteur particulier peut être plus intéressant qu’un autre.
C’est particulièrement vrai pour le facteur Mat avec une productivité moyenne minimale de 8.22 unités d’output pour une unité de matériaux et jusqu’à 301.43 unités d’output pour une unité de matériaux.
3.2 Corrélations entre les quantités des 3 facteurs de production
| Matrice de corrélation | |||
| \(q_{Cap}\) | \(q_{Lab}\) | \(q_{Mat}\) | |
|---|---|---|---|
\(q_{Cap}\) |
1.00 | 0.59 | 0.66 |
\(q_{Lab}\) |
0.59 | 1.00 | 0.79 |
\(q_{Mat}\) |
0.66 | 0.79 | 1.00 |
Les quantités des 3 facteurs de production sont toutes corrélées positivement.
On s’aperçoit que la corrélation positive la plus importante est entre \(q_{Lab}\) et \(q_{Mat}\) \(\Rightarrow\) cela implique que lorsque la quantité de travail augmente, la quantité de matériaux a tendance à augmenter dans un niveau très similaire, et vice versa.
3.3 Corrélations entre les productivités moyennes
Essayons maintenant de comprendre comment les productivités moyennes individuelles sont corrélées :
| Matrice de corrélation | |||
| \(AP_{Cap}\) | \(AP_{Lab}\) | \(AP_{Mat}\) | |
|---|---|---|---|
\(AP_{Cap}\) |
1.00 | 0.51 | 0.46 |
\(AP_{Lab}\) |
0.51 | 1.00 | 0.73 |
\(AP_{Mat}\) |
0.46 | 0.73 | 1.00 |
Ces résultats nous suggèrent l’existence de relations positives entre les productivités moyennes des différents facteurs de production dans le processus de production.
Ici, une augmentation de la productivité moyenne du travail peut être associée à une augmentation significative de la productivité moyenne des matériaux, ce qui peut être dû à des facteurs tels que des processus de production plus efficaces ou une meilleure utilisation des ressources de la part du producteur de pommes.
Les représentations des productivités moyennes \(AP_{Cap}\), \(AP_{Lab}\) et \(AP_{Mat}\) par rapport à l’output \(q_{Out}\) peuvent aussi être très utiles pour comprendre les relations entre la production totale et l’utilisation des différents facteurs de production.
- Les valeurs extrêmes dans ces nuages de points nous permettent de distinguer aisément les producteurs efficaces et inefficaces dans l’utilisation des ressources.
3.4 Indices de Paasche, Laspeyres et Fisher
Les productivités moyennes nous donnent une indication facteur par facteur, mais elles ne nous donnent pas nécessairement d’information globale. Dans ce cadre, on peut alors se demander comment agréger des quantités avec une règle ad hoc en un indice synthétique.
3 Indices principaux existent
\[ \text{Paasche}_{index} = \frac{(v_{Cap} + v_{Lab} + v_{Mat})}{{\bar{q}_{Cap}}\cdot p_{Cap} + \bar{q}_{Lab}\cdot p_{Lab} + \bar{q}_{Mat} \cdot p_{Mat}} \]
\[ \text{Laspeyres}_{index} = \frac{(q_{Cap} \cdot \bar{p}_{Cap} + q_{Lab} \cdot \bar{p}_{Lab} + q_{Mat} \cdot \bar{p}_{Mat})}{(\bar{q}_{Cap}\cdot \bar{p}_{Cap}+\bar{q}_{Lab}\cdot \bar{p}_{Lab}+\bar{q}_{Mat}\cdot \bar{p}_{Mat})} \]
\[ \text{Fisher}_{index} = \sqrt{\text{Paasche}_{index} \cdot \text{Laspeyres}_{index}} \]
De plus, la fonction quantityIndex du package micEconIndex a l’intérêt de facilement intégrer les calculs de chaque indice (Voir ci-dessous).
apples <- apples |> mutate(
L_Index = quantityIndex(
prices = c("pCap", "pLab", "pMat"),
quantities = c("qCap", "qLab", "qMat"),
data = apples,
method = "Laspeyres"
),
P_Index = quantityIndex(
prices = c("pCap", "pLab", "pMat"),
quantities = c("qCap", "qLab", "qMat"),
data = apples,
method = "Paasche"
),
F_Index = quantityIndex(
prices = c("pCap", "pLab", "pMat"),
quantities = c("qCap", "qLab", "qMat"),
data = apples,
method = "Fisher"
)
)D’après cette visualisation on peut conclure que faire le choix de l’indice de Paasche ou de Laspeyres revient sensiblement à la même interprétation.
Note : Etant donné que l’indice de Fisher est une moyenne géométrique des deux indices, il n’est pas non plus nécessaire de le représenter puisque la relation linéaire entre les deux indices sera presque parfaite dans ce cas.
| Matrice de corrélation | ||||
| \(AP_{Cap}\) | \(AP_{Lab}\) | \(AP_{Mat}\) | \(\text{Fisher}_{index}\) | |
|---|---|---|---|---|
\(AP_{Cap}\) |
1.00 | 0.51 | 0.46 | 0.11 |
\(AP_{Lab}\) |
0.51 | 1.00 | 0.73 | 0.36 |
\(AP_{Mat}\) |
0.46 | 0.73 | 1.00 | 0.23 |
\(\text{Fisher}_{index}\) |
0.11 | 0.36 | 0.23 | 1.00 |
- Ces résultats suggèrent que l’indice de Fisher n’est pas fortement corrélé avec les productivités moyennes individuelles des facteurs de production.
3.5 Productivité globale des facteurs
- Dans la section précédente, nous avons montré que les indices donnaient sensiblement les mêmes résultats. Nous avons néanmoins choisi en tant qu’indice de productivité globale des facteurs l’indice de Fisher, étant donné qu’il est une moyenne géométrique de l’indice de Paasche et de celui de Laspeyres.
- De manière intéressante, contrairement aux histogrammes des productivités moyennes de la Section 3.1, la plupart des valeurs que prend l’indice de Fisher sont plus concentrées.
La variable dichotomique adv présente dans notre dataset est définie par :
\[ adv = \begin{cases} 0 \text{ si le producteur n'est pas conseillé}\\ 1 \text{ si le producteur est conseillé} \end{cases} \]
On pourrait penser que les producteurs qui ont été conseillés par des laboratoires d’agronomie ont un indice de productivité globale plus important que ceux qui ne l’ont pas été.
Vérifions-le graphiquement et statistiquement
- En moyenne, il semble ne pas y avoir de différence de productivité globale lorsque le producteur est conseillé. En effet, la productivité moyenne avec conseil est égale à 0.95 tandis que la productivité moyenne sans conseil est quant à elle égale à 1.
On peut aussi s’assurer que les moyennes sont significativement différentes en faisant un test de Student bilatéral :
\[ \begin{cases} H_0:\mu_{advice} =\mu_{no\_advice}\\ H_1:\mu_{advice} \neq\mu_{no\_advice} \end{cases} \]
\(\Rightarrow\) Au risque \(\alpha = 5\%\), la \(p-value\) issue du test est égale à 0.64 \(> 0.05\), on conserve donc l’hypothèse nulle \(H_0\), c’est à dire qu’il n’y a pas de différence significative dans les productivités globales quand le producteur est conseillé/ qu’il ne l’est pas.
4 Analyse exploratoire
4.1 Analyse en composantes principales
L’analyse en composantes principales (ACP) que nous nous apprêtons à faire est justifiée dans notre contexte car nous n’avons que des variables numériques.
Les deux premiers axes concentrent 60% de la variance. Nous allons dès lors limiter notre ACP à l’étude de ces axes.
Axe 1 \(\Rightarrow\) Combinaison de variables : synthéthise les indices de Fisher, Paasche et Laspeyres (
F_Index,P_Index,L_Index), ainsi que les quantités (qOut,qLab,qCap,qMat) et les coûts des 3 facteurs de production (vMat,vLab,vCap).Axe 2 \(\Rightarrow\) Productivités moyennes (
AP_Cap,AP_Mat,AP_Lab) et prix de vente de la production (pOut)
Dans notre ACP, on ne constate pas de variables qui sont fortement opposées. Elle permet néanmoins de mettre en avant le lien entre les quantités des facteurs de production et leur valeur. On observe également que le prix de vente est étroitement lié avec les productivités moyennes.
4.2 Bonus : La répartition de qOut
Lorsque l’on s’intéresse à la distribution de qOut et que l’on met ces valeurs en logarithme, on remarque une distribution proche d’une loi normale. Cette observation est confirmée par le test de Shapiro effectué ci-dessous.
\[ \begin{cases} H_0: \ln(q_{Out})\text{ suit une distribution normale} \\ H_1: \ln(q_{Out})\text{ ne suit pas une distribution normale} \end{cases} \]
Code
pval_shap_test <- shapiro.test(log(apples$qOut))$p.value\(\Rightarrow\) Au seuil \(\alpha = 5\%\), le test de Shapiro confirme statistiquement le fait que les données ln(qOut) suivent une distribution normale avec une \(p-value\) = 0.11 soit \(> 0.05\), donc \(H_0\) n’est pas rejeté.
5 Fonctions de production
Une fonction de production représente la relation entre les quantités des différents facteurs de production utilisés (ici
qCap,qLab,qMat) et la quantité de production obtenue (iciqOut).
5.1 Fonction de production linéaire
\[ q_i = \alpha + \sum_{k=1}^3\beta_k x_{ik} + ε_i \]
- La fonction de production linéaire dans notre cas s’écrit donc sous la forme :
\[ q_{Out} = \alpha + \beta_1 q_{Cap} + \beta_2 q_{Lab} + \beta_3 q_{Mat} + ε_i \]
On a pu constater un lien indéniable entre la quantité produite (qOut) et les productivités moyennes. On peut alors légitimement penser qu’il existe une relation entre la quantité produite et les quantités des facteurs de production.
Avant de s’aventurer dans des formes fonctionnelles plus complexes, commençons par utiliser une simple fonction de production linéaire.
linreg_prod <- lm(qOut ~ qCap + qLab + qMat, data = apples)| Fonction de production linéaire | |||||
Variable dépendante : qOut |
|||||
| Description | Coefficients | Ecart Type | Pvalues | Significativité | |
|---|---|---|---|---|---|
\(\alpha\) |
|
−1,615,978.639 | +/- 231771.709 | 0 | \(***\) |
\(\beta_1\) |
|
1.788 | +/- 1.995 | 0.372 | |
\(\beta_2\) |
|
11.831 | +/- 1.272 | 0 | \(***\) |
\(\beta_3\) |
|
46.668 | +/- 11.234 | 0 | \(***\) |
| Observations : 140 | |||||
| |
|||||
| \(R^2=\) 0.787 | |||||
| \(R^2_{adj}=\) 0.782 | |||||
Le coefficient associé à
qCapest de 1.788, mais il n’est pas statistiquement significatif, ce qui suggère que la quantité de capital n’a pas une influence significative sur la production totale.Le coefficient associé à
qLabest de 11.831 avec un niveau de significativité très élevé, ce qui signifie que pour chaque unité supplémentaire de travail utilisée, la production totale augmente en moyenne de 11.831 unités, ceteris paribus. Cela revèle une fois de plus l’influence importante de la quantité de travail sur la quantité d’output.Le coefficient associé à
qMatest de 46.668 avec un niveau de significativité très élevé, ce qui indique que pour chaque unité supplémentaire de matériaux utilisés, la production totale augmente en moyenne de 46.668 unités, ceteris paribus.
\(R^2_{adj}=\) 0.782 donc 78.2% de la variance de la production totale est expliquée par la variance des variables explicatives.
La multicolinéarité est un problème qui survient lorsque certaines variables explicatives du modèle mesurent le même phénomène.
Une multicolinéarité importante peut s’avérer problématique, car elle peut augmenter la variance des coefficients de régression et ainsi les rendre instables.
Les VIF (Variance Inflation Factor) estiment de combien la variance d’un coefficient est augmentée en raison d’une relation linéaire avec d’autres prédicteurs.
- Ici, les VIF sont faibles \((<5)\), il n’y a donc pas de raison de s’inquiéter concernant une éventuelle multicolinéarité
5.1.1 Spécification de la forme fonctionnelle
On peut utiliser un RESET test pour vérifier si la forme fonctionnelle linéaire est la bonne spécification.
\[ \begin{cases} H_0 : \text{La relation entre la variable a predire et un ou plusieurs predicteurs est lineaire} \\ H_1 : \text{La relation entre la variable a predire et un ou plusieurs predicteurs est quadratique} \end{cases} \]
\(\Rightarrow\) Au risque \(\alpha = 5\%\), la \(p-value\) issue du test est \(< 0.05\), on rejette donc l’hypothèse nulle \(H_0\), c’est à dire qu’on va préférer prendre une forme fonctionnelle incluant des effets quadratiques.
Malgré un \(R^2_{adj}\) proche de 0.8, ce qui signifie que le modèle a plutôt un bon ajustement, la spécification linéaire possède plusieurs problèmes :
- Les rendements d’échelle sont fixés comme constants dans la forme fonctionnelle.
- Elle ne permet pas d’évaluer les possibilités de substitution entre les trois facteurs de production.
\(\Rightarrow\) Face à ces inconvénients du modèle linéaire, la fonction Cobb-Douglas permet de fournir une réponse au point (1).
5.2 Fonction de production Cobb-Douglas
\[ q_i = A \prod_{k=1}^3 x_{ik}^{a_k}ε_i \]
- La fonction de production Cobb-Douglas dans notre cas s’écrit donc sous la forme :
\[ q_{Out} = A\cdot q_{Cap}^\alpha \cdot q_{Lab}^\beta \cdot q_{Mat}^\gamma \cdot ε_i \]
On peut aussi facilement linéariser la fonction pour pouvoir la préparer à une procédure lm, dès lors on obtient :
\[ \ln(q_{out}) = \ln(A) + \alpha \cdot \ln(q_{Cap}) + \beta \cdot \ln(q_{Lab}) + \gamma \cdot \ln(q_{Mat}) + \ln{(ε_i)} \]
Le package micEcon propose néanmoins l’estimation d’une fonction de production Cobb-Douglas grâce à la fonction translogEst et l’argument linear = TRUE1.
cd_prod <- translogEst(
"qOut",
c("qCap", "qLab", "qMat"),
data = apples,
linear = TRUE
)| Fonction de production Cobb-Douglas | |||||
Variable dépendante : qOut |
|||||
| Description | Coefficients | Ecart Type | Pvalues | Significativité | |
|---|---|---|---|---|---|
\(A\) |
|
−2.064 | +/- 1.313 | 0.118 | |
\(\alpha\) |
|
0.163 | +/- 0.087 | 0.064 | \(*\) |
\(\beta\) |
|
0.676 | +/- 0.154 | 0 | \(***\) |
\(\gamma\) |
|
0.627 | +/- 0.126 | 0 | \(***\) |
| Observations : 140 | |||||
| |
|||||
| \(R^2=\) 0.594 | |||||
| \(R^2_{adj}=\) 0.585 | |||||
Dans le cadre de cette régression, étant donné que le modèle est sous forme \(\log-\log\), on peut interpréter les 3 coefficients comme des élasticités partielles :
\(\alpha \Rightarrow\) Un changement d’un pourcent de
qCapinduit un changement de 0.163% deqOut, ceteris paribus.\(\beta \Rightarrow\) Un changement d’un pourcent de
qLabinduit un changement de 0.676% deqOut, ceteris paribus.\(\gamma \Rightarrow\) Un changement d’un pourcent de
qMatinduit un changement de 0.627% deqOut, ceteris paribus.
Note : les coefficients sont significatifs au seuil de 10% pour
qCap, 1% pourqLabet 1% pourqMat.
- Le \(R^2_{adj}=\) 0.585. On ne peut cependant pas directement comparer les \(R^2_{adj}\) entre les fonctions de production linéaires et Cobb-Douglas puisque les variables dépendantes ne sont pas les mêmes.
Code
check_posterior_predictions(cd_prod_2)5.2.1 Rendements d’échelle
On l’a vu ci-dessus, les exposants \(\alpha\), \(\beta\) et \(\gamma\) sont les élasticités de la production, c’est-à-dire qu’ils mesurent respectivement le changement en pourcentage de l’output aux variations en pourcentage de la quantité de capital, de la quantité de travail et de la quantité de matériaux.
- Grâce à ces coefficients estimés, on peut déterminer les rendements d’échelle.
Décroissants si \(\hat{\alpha} + \hat{\beta} + \hat{\gamma} < 1\)
Constants si \(\hat{\alpha} + \hat{\beta} + \hat{\gamma} = 1\)
Croissants si \(\hat{\alpha} + \hat{\beta} + \hat{\gamma} > 1\)
alpha <- cd_prod$coef[2] |> unname()
beta <- cd_prod$coef[3] |> unname()
gamma <- cd_prod$coef[4] |> unname()
return_to_scale <- alpha + beta + gammaOn trouve que \(\hat{\alpha} + \hat{\beta} + \hat{\gamma} =\) 1.47, donc les rendements d’échelles sont croissants, c’est à dire que le processus de production présente des économies d’échelle. Un accroissement identique de tous les facteurs conduit à un accroissement plus important de la production.
Ces rendements d’échelle croissants sont souvent le résultat de coûts fixes élevés (voir la Section 2.1 pour s’en convaincre).
Une implication de ce résultat est que des installations de production à grande échelle ont tendance à être plus efficaces que des installations à petite échelle.
Intéressons-nous à l’élasticité de substitution, qui mesure la facilité avec laquelle un input peut être substitué par un autre.
Si l’elasticité de substitution n’est pas empiriquement estimable pour la Cobb-Douglas, celle-ci suppose implicitement que l’élasticité de substitution de Allen est égale à un, soit \(\sigma_{\{\text{qCap, qLab, qMat}\}} = 1\).
Cela implique une substitution parfaite entre les facteurs de production \(q_{Cap}\), \(q_{Lab}\) et \(q_{Mat}\), ce qui va clairement à l’encontre des résultats de la Section 3.1.
5.2.2 Productivité marginale des inputs
La productivité marginale se réfère à la variation de la production totale résultant d’une petite variation d’un facteur de production spécifique, toutes choses égales par ailleurs.
En d’autres termes, il s’agit de la quantité supplémentaire d’output qu’une entreprise peut produire en utilisant une unité supplémentaire d’un facteur de production donné, tout en maintenant constantes les quantités des autres facteurs de production.
Nous obtenons alors respectivement :
\(MP_{Cap} = \frac{\partial q_{Out}}{\partial q_{Cap}}\)
\(MP_{Lab} = \frac{\partial q_{Out}}{\partial q_{Lab}}\)
\(MP_{Mat} = \frac{\partial q_{Out}}{\partial q_{Mat}}\)
On peut facilement calculer ces productivités marginales avec la fonction cobbDouglasDeriv.
cd_prod_margProducts <- cobbDouglasDeriv(
c("qCap", "qLab", "qMat"),
data = apples, coef = coef(cd_prod)[1:4],
coefCov = vcov(cd_prod)[1:4, 1:4]
)Cobb-Douglas- Par exemple, pour le producteur 1 :
- L’augmentation d’une unité de capital tout en maintenant constant le niveau de travail et de matériaux entraînera une augmentation de 6.23 unités d’output.
- L’augmentation d’une unité de travail tout en maintenant constant le niveau de capital et de matériaux entrainera une augmentation de 6.03 unités d’output.
- L’augmentation d’une unité de matériaux tout en maintenant constant le niveau de travail et de capital entrainera une augmentation de 59.09 unités d’output.
On remarque dans ce modèle que la productivité marginale des matériaux est supérieure à celle du capital et du travail pour tous les producteurs. De plus, aucune productivité marginale n’est négative, c’est à dire que rajouter des quantités de n’importe quel input sans augmenter les autres résultera toujours en une augmentation de la production.
5.3 Fonction de production quadratique
\[ q_i = \alpha + \sum_{k=1}^3\beta_k x_{ik} + \frac{1}{2}\sum_{l=1}^3\sum_{k=1}^3 \beta_{kl}x_{ik}x_{il} + ε_i \]
- La fonction de production quadratique dans notre cas s’écrit donc sous la forme :
\[ \begin{gathered}q_{Out}=α+β_1q_{Cap}+β_2q_{Lab}+β_3q_{Mat}\\ +\frac{1}{2}(β_{11}q^2_{Cap}+β_{22}q^2_{Lab}+β_{33}q^2_{Mat})\\ +β_{12}q_{Cap}q_{Lab}+β_{13}q_{Cap}q_{Mat}+β_{23}q_{Lab}q_{Mat}+ε_i \end{gathered} \]
✅ Avantages :
- La fonction de production quadratique va permettre d’ajouter des termes quadratiques et des effets d’interaction, rendant la modélisation plus robuste.
❌ Inconvénients :
- L’ajout de termes supplémentaires implique plus de complexité et de coefficients à estimer \((3^2 = 9)\).
quad_prod <- quadFuncEst(
"qOut",
c("qCap", "qLab", "qMat"),
data = apples
)| Fonction de production quadratique | |||||
Variable dépendante : qOut |
|||||
| Description | Coefficients | Ecart Type | Pvalues | Significativité | |
|---|---|---|---|---|---|
\(\alpha\) |
|
−291,113.132 | +/- 361461.083 | 0.422 | |
\(\beta_1\) |
|
5.27 | +/- 4.403 | 0.234 | |
\(\beta_2\) |
|
6.077 | +/- 3.185 | 0.059 | \(*\) |
\(\beta_3\) |
|
14.303 | +/- 24.057 | 0.553 | |
\(\beta_{11}\) |
|
0.00005 | +/- 0 | 0.176 | |
\(\beta_{12}\) |
|
−0.00003 | +/- 0 | 0.041 | \(**\) |
\(\beta_{13}\) |
|
−0.00004 | +/- 0 | 0.778 | |
\(\beta_{22}\) |
|
−0.00003 | +/- 0 | 0.141 | |
\(\beta_{23}\) |
|
0.0004 | +/- 0 | 0 | \(***\) |
\(\beta_{33}\) |
|
−0.002 | +/- 0.001 | 0.036 | \(**\) |
| Observations : 140 | |||||
| |
|||||
| \(R^2=\) 0.845 | |||||
| \(R^2_{adj}=\) 0.834 | |||||
Le coefficient associé à
qCapest de 5.27, mais il n’est pas statistiquement significatif, ce qui suggère que la quantité de capital n’a pas une influence significative sur la production totale dans ce modèle.Le coefficient associé à
qLabest de 6.077 avec un niveau de significativité assez faible, ce qui signifie que pour chaque unité supplémentaire de travail utilisée, la production totale augmente en moyenne de 6.077 unités, toutes choses égales par ailleurs.Le coefficient associé à
qMatest de 14.303, mais il n’est pas statistiquement significatif, ce qui suggère que la quantité de matériaux n’a pas une influence significative sur la production totale dans ce modèle.Le coefficient associé à l’effet d’interaction entre les quantités de capital et de travail (
qCap×qLab) est négatif et significatif au seuil de 5%. Cela suggère que l’interaction entre ces 2 facteurs a un effet négatif sur la production.Le coefficient associé à l’effet d’interaction entre les quantités de tavail et de matériaux (
qLab×qMat) est positif et significatif au seuil de 1%. Cela suggère que l’interaction entre ces 2 facteurs a un effet positif sur la production.Enfin, le coefficient associé à l’effet quadratique des matériaux (
qMat²) est statistiquement significatif au seuil 5% et possède une valeur négative, ce qui suggère une courbe de rendement d’échelle décroissante pour les matériaux, indiquant que l’augmentation de la quantité de matériaux pourrait initialement augmenter la production, mais à un rythme décroissant.
\(R^2_{adj} =\) 0.834 donc 83.4% de la variance de la production totale est expliquée par la variance des variables explicatives. Ce résultat est meilleur que la fonction de production linéaire.
Les valeurs de VIF sont ici extrêmement élevées. La forme fonctionnelle du modèle avec interactions et effets quadratiques entraîne naturellement ces forts problèmes de multicolinéarité.
Code
posterior_predictive_check(quad_prod_2)On semble être dans une situation de surapprentissage, en effet le modèle s’ajuste trop par rapport aux données sur lesquelles il a été entrainé, il généralise donc mal et est très sensible au bruit.
5.3.1 Rendements d’échelle
Cette fois, pour calculer les rendements d’échelle, il faut vérifier la relation existant entre :
\[ \begin{gathered} f(\lambda q_{Cap}, \lambda q_{Lab}, \lambda q_{Mat},\\ \lambda q_{Cap}^2, \lambda q_{Lab}^2, \lambda q_{Mat}^2,\\ \lambda q_{Cap}q_{Lab}, \lambda q_{Cap}q_{Mat}, \lambda q_{Lab}q_{Mat}) \end{gathered} \tag{1}\]
et
\[ \begin{gathered} \lambda \times f(q_{Cap}, q_{Lab}, q_{Mat},\\ q_{Cap}^2, q_{Lab}^2, q_{Mat}^2, \\q_{Cap}q_{Lab}, q_{Cap}q_{Mat}, q_{Lab}q_{Mat}) \end{gathered} \tag{2}\]
Décroissants si équation 1 \(<\) équation 2
Constants si équation 1 \(=\) équation 2
Croissants si équation 1 \(>\) équation 2
TRES BANCAL
Code
lambda <- rep(3, 140)
quad_prod_3 <- lm(
qOut ~ lambda * qCap + lambda * qLab + lambda * qMat +
qCap2 + qLab2 + qMat2 +
I(qCap * qLab) + I(qLab * qMat) + I(qMat * qCap),
data = apples
)
quad_x1 <- predict(quad_prod_2)
quad_x2 <- predict(quad_prod_3)
quad_x2 / quad_x1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
5.3.2 Productivité marginale des inputs
quad_prod_margProducts <- quadFuncDeriv(
c("qCap", "qLab", "qMat"),
data = apples,
coef = coef(quad_prod),
coefCov = vcov(quad_prod)
)quadratiqueCette fois on remarque qu’il existe des productivités marginales négatives. Prenons l’exemple du producteur 1. Si celui-ci décide d’ajouter une unité de capital en maintenant les autres inputs constants (travail et matériaux), alors sa production va diminuer de 3.07 unités.
5.4 Fonction de production Translog
\[ \begin{gathered} \ln(q_i) = \alpha + \sum_{k=1}^3\beta_k\ln(x_{ik})\\ + \frac{1}{2}\sum_{l=1}^3\sum_{k=1}^3 \beta_{kl}\ln(x_{ik})ln(x_{il}) + ε_i \end{gathered} \]
- La fonction de production Translog dans notre cas s’écrit donc sous la forme :
\[ \begin{gathered}\ln(q_{Out})=α+β_1 \ln(q_{Cap})+β_2 \ln(q_{Lab})+β_3 \ln(q_{Mat})\\ +\frac{1}{2}\left(β_{11}\ln(q^2_{Cap})+β_{22}\ln(q^2_{Lab})+β_{33}\ln(q^2_{Mat})\right)\\ +β_{12}\ln(q_{Cap}q_{Lab})+β_{13}\ln(q_{Cap}q_{Mat})+β_{23}\ln(q_{Lab}q_{Mat})+ε_i \end{gathered} \]
translog_prod <- translogEst(
"qOut",
c("qCap", "qLab", "qMat"),
data = apples
)| Fonction de production Translog | |||||
Variable dépendante : qOut |
|||||
| Description | Coefficients | Ecart Type | Pvalues | Significativité | |
|---|---|---|---|---|---|
\(A\) |
|
−4.146 | +/- 21.359 | 0.846 | |
\(\beta_1\) |
|
−2.307 | +/- 2.288 | 0.315 | |
\(\beta_2\) |
|
1.993 | +/- 4.566 | 0.663 | |
\(\beta_3\) |
|
2.232 | +/- 3.763 | 0.554 | |
\(\beta_{11}\) |
|
−0.026 | +/- 0.208 | 0.902 | |
\(\beta_{12}\) |
|
0.562 | +/- 0.291 | 0.056 | \(*\) |
\(\beta_{13}\) |
|
−0.41 | +/- 0.235 | 0.084 | \(*\) |
\(\beta_{22}\) |
|
−1.164 | +/- 0.679 | 0.089 | \(*\) |
\(\beta_{23}\) |
|
0.658 | +/- 0.428 | 0.126 | |
\(\beta_{33}\) |
|
−0.504 | +/- 0.435 | 0.249 | |
| Observations : 140 | |||||
| |
|||||
| \(R^2=\) 0.63 | |||||
| \(R^2_{adj}=\) 0.604 | |||||
Conséquence : L’estimation par moindres carrés ordinaires d’une forme flexible comme la fonction Translog donne des résultats assez médiocres.
En effet, seulement 3 coefficients sont significatifs au seuil de 10% :
qCap×qLabqCap×qMatqLab²Le \(R^2_{adj}\) est un peu plus elevé que celui de la Cobb-Douglas, autour de 0.6.
5.4.1 Coût marginal de la production
Le coût marginal correspond à la fabrication d’une unité supplémentaire d’output (qOut).
La fonction translogProdFuncMargCost nous permet d’estimer ces coûts marginaux dans le cadre d’une fonction de production Translog.
Si le coût marginal est très proche de 0, cela signifie que produire plus ne coûte que très peu cher au producteur. On s’attend donc à ce que les installations qui produisent le plus de pommes aient un coût marginal \(\simeq 0\) grâce aux économies d’échelles qu’ils réalisent.
Si le coût marginal est \(< 0\), cela signifie que produire moins coûte plus à l’entreprise. Dans ce cas l’entreprise a intérêt à produire plus jusqu’à atteindre un coût marginal proche de 0.
Si le coût marginal est \(> 0\), alors il faut que le producteur compare le prix
pOutqu’il peut obtenir et son coût marginal pour décider si il doit ou non produire davantage.
margCost <- translogProdFuncMargCost(
yName = "qOut",
xNames = c("qCap", "qLab", "qMat"),
wNames = c("pCap", "pLab", "pMat"),
data = apples, coef = coef(translog_prod)
)5.4.2 Vérification des conditions de régularité
En premier lieu, on peut vérifier la monotonie de la fonction.
mono <- translogCheckMono(
c("qCap", "qLab", "qMat"),
data = apples,
coef = coef(translog_prod),
increasing = TRUE
)\(\Rightarrow\) Cette fonction de production Translog augmente de manière monotone dans les facteurs de production qCap, qLab, qMat, dans 65,7% des observations.
En second lieu, on peut vérifier si la fonction de production est quasi-concave.
La quasi-concavité garantit que la production réagit de manière décroissante aux augmentations marginales des inputs. Autrement dit, une augmentation marginale d’un input entraîne une augmentation marginale de la production qui décroît au fur et à mesure que cet input augmente.
curv <- translogCheckCurvature(
c("qCap", "qLab", "qMat"),
data = apples,
coef = coef(translog_prod),
convexity = FALSE,
quasi = TRUE
)\(\Rightarrow\) Cette fonction de production Translog est quasi-concave dans 45% des observations.
5.5 Fonction de production CES
La fonction de production CES avec 3 variables explicatives s’écrit :
\[ q_i = \gamma \left(\sum^3_{i=1}\delta_k x_{ik}^{-\rho}\right)^{-\frac{1}{\rho}} + \varepsilon_i \]
Cependant, utiliser cette forme fonctionnelle peut s’avérer problématique car elle impose que toute paire d’inputs aient la même élasticité de substitution, soit par exemple que \(\sigma_{\{\text{qCap, qLab}\}} = \sigma_{\{\text{qCap, qMat}\}}\), alors même
- Tandis que la fonction de production CES emboitée proposée par Sato (1967) dans notre cas s’écrit sous la forme :
\[ q_{Out} = \gamma\left[\delta \cdot \left(\delta_1 q_{Cap}^{-\rho_1}+ (1-\delta_1)q_{Lab}^{-\rho_1}\right)^{\frac{\rho}{\rho_1}} +(1-\delta)q_{Mat}^{-\rho} \right]^{-{\frac{1}{\rho}}} + \varepsilon_i \]
Nous estimerons cette fonction. 2
De part sa définition, la fonction CES est à rendements d’échelle constants.
ces_prod <- cesEst(
"qOut",
c("qCap", "qLab", "qMat"),
data = apples,
method = "SANN",
returnGrad = TRUE,
)Parmi les méthodes d’optimisation disponibles, aucune ne fonctionne à part celle du SANN (Simulated Annealing). La méthode SANN ou Recuit Simulé en français est une technique probabiliste pour approximer l’optimum global d’une fonction donnée.
Le nom provient du recuit en métallurgie. Pour plus de détail, voir la page wikipédia correspondante : https://en.wikipedia.org/wiki/Simulated_annealing
| Fonction de production CES emboîtée | ||||
Variable dépendante : qOut |
||||
| Coefficients | Ecart Type | Pvalues | Significativité | |
|---|---|---|---|---|
\(\gamma\) |
47.081 | 29.915 | 0.116 | |
\(\delta_1\) |
−0.106 | 0.505 | 0.833 | |
\(\delta\) |
0.291 | 0.568 | 0.609 | |
\(\rho_1\) |
−0.406 | 4.508 | 0.928 | |
\(\rho\) |
−0.448 | 1.313 | 0.733 | |
| Observations : 140 \(R^2 =\) 0.713 | ||||
| |
||||
| Elasticités de Substitution | ||||
| Hicks-McFadden \(\Rightarrow \sigma_{\text{\{qCap, qLab\}}} =\) 1.68 | ||||
| Allen-Uzawa \(\Rightarrow \sigma_{\text{\{qCap, qLab\}} | \text{qMat}} =\) 1.81 | ||||
L’élasticité de substitution de Hicks-McFadden \(\left(\frac{1}{1 + \rho_1}\right)\) mesure la substituabilité entre les deux premiers facteurs de production, c’est à dire entre
qCapetqLab. Les deux facteurs de production sont fortement substituables.L’élasticité de substitution de Allen-Uzawa \(\left(\frac{1}{1 + \rho}\right)\) est ici égale à 1.81. Celle-ci étant supérieure à 1, cela signifie que le facteur de production
qMatest fortement substituable entre la combinaison des 2 autres facteurs de productionsqCapetqLab. En d’autres termes, une augmentation du prix relatif d’une combinaison des 2 facteurs (qCapetqLab) entraînera une substitution versqMat.
5.6 Fonction de production SFA
Dans le modèle SFA (Stochastic Frontier Analysis), on introduit un terme multiplicatif \(TE_i\). Ce terme représente l’efficacité technique, définie comme le ratio d’output observé sur l’output maximum réalisable, soit : \(TE_i = \frac{q_i}{q_i^*}\).
- On peut ré-écrire ce \(TE_i\) sous la forme \(\exp\left\{-u_i\right\}\).
Utiliser un tel modèle va donc nous permettre de pouvoir estimer l’efficacité technique producteur par producteur.
Note : Nous pouvons utiliser plusieurs formes fonctionnelles pour ce modèle, sous la contrainte que notre variable à prédire soit mise sous forme logarithmique, ce qui élimine de facto les modèles de production linéaire et quadratique.
\[ q_i = A\prod_{k=1}^3x_{ik}^{a_k}\cdot \underbrace{\exp\left\{-u_i\right\} \cdot \exp\left\{v_i\right\}}_{\varepsilon_i} \]
- La fonction de production SFA Cobb-Douglas dans notre cas s’écrit donc sous la forme :
\[ q_{Out} = A\cdot q_{Cap}^\alpha \cdot q_{Lab}^\beta \cdot q_{Mat}^\gamma \cdot \exp\left\{-u_i\right\} \cdot \exp\left\{v_i\right\} \]
En linéarisant on obtient :
\[ \ln(q_{out}) = \ln(A) + \alpha \cdot \ln(q_{Cap}) + \beta \cdot \ln(q_{Lab}) + \gamma \cdot \ln(q_{Mat}) + v_i - u_i \]
cd_sfa <- sfa(log(qOut) ~ log(qCap) + log(qLab) + log(qMat), data = apples)| Fonction de production Cobb-Douglas SFA | |||||
Variable dépendante : qOut |
|||||
| Description | Coefficients | Ecart Type | Pvalues | Significativité | |
|---|---|---|---|---|---|
\(A\) |
|
0.229 | 1.248 | 0.854 | |
\(\alpha\) |
|
0.161 | 0.082 | 0.049 | \(**\) |
\(\beta\) |
|
0.685 | 0.147 | 0.000 | \(***\) |
\(\gamma\) |
|
0.466 | 0.132 | 0.000 | \(***\) |
| Observations : 140 | |||||
| |
|||||
| Log-Vraisemblance \(=\) -133.889 | |||||
| Efficacité moyenne \(=\) 0.538 | |||||
- On remarque que les coefficients et les niveaux de significativité trouvés par l’estimateur du maximum de vraisemblance sont très proches de ceux de la Cobb-Douglas estimés par OLS dans la Section 5.2.
5.6.1 Analyse de l’efficacité technique des producteurs
L’efficacité technique moyenne des 140 producteurs est de 0.538, c’est à dire qu’il y a certainement un nombre important de producteurs “inefficients”.
En utilisant l’espérance conditionnelle \(E(\exp(−u_i)|\epsilon_i)\), on peut estimer le score d’efficacité pour chaque observation. Dans ce cas, les estimations d’efficacité ont des valeurs comprises entre zéro et un, où un indique que le producteur de pommes est pleinement efficace dans sa production et zéro indique que le producteur est totalement inefficace.
efficiencies <- efficiencies(cd_sfa) |> as_tibble()- Le graphique ci-dessus nous permet de constater qu’en moyenne, plus la production est elevée, plus l’efficacité du producteur estimée par le modèle Cobb-Douglas SFA le sera à son tour. Néanmoins, les producteurs dont la production est très importante ne sont pourtant pas les plus efficaces techniquement comme le montrent les quelques points qui se détachent de la tendance linéaire.
5.6.2 Tests statistiques
Le test de rapport de vraisemblance est un test d’hypothèse qui compare l’adéquation de l’ajustement de deux modèles afin de déterminer celui qui offre le meilleur ajustement. Dans notre cas, on veut comparer le modèle Cobb-Douglas estimé par Moindres Carrés Ordinaires et le modèle Cobb-Douglas SFA estimé par la méthode du Maximum de Vraisemblance.
Les hypothèses du test sont les suivantes : \[ \begin{cases} H_0: \text{Modele } 1 \Rightarrow \text{Ordinary Least Squares}\\ H_1: \text{Modele } 2 \Rightarrow \text{Error Component Frontier} \end{cases} \]
La statistique de test est \(\lambda_{LR} = 2\cdot(\ln \mathcal{L}_1-\ln \mathcal{L}_2)\)
\(\mathcal{L}_1 =\) -137.609
\(\mathcal{L}_2 =\) -133.889
\(\Rightarrow\) Au risque \(\alpha = 5\%\), la \(p-value\) issue du test est égale à 0.003 \(< 0.05\), on rejette donc l’hypothèse nulle \(H_0\), c’est à dire que le modèle de frontière de production Cobb-Douglas offre un meilleur ajustement.
5.7 Machine Learning de production
À titre expérimental, il est envisageable d’explorer l’utilisation du Machine Learning pour étudier la production de pommes.
Cependant, compte tenu du peu de données disponibles, cette approche n’est pas idéale. Nous envisageons néanmoins d’appliquer un algorithme de Random Forest. Ce modèle permet d’extraire l’importance des variables, offrant ainsi une certaine transparence dans le fonctionnement de ce modèle de Machine Learning souvent perçu comme une boîte noire.
Comme pour les fonction de production nous tentons d’expliquer la variable qOut à partir des variables qLab, qCap et qMat.
- Effectuons un train-test split sur nos données.
apples_ML <- apples |> select(qOut, qCap, qLab, qMat)
split <- apples_ML |> initial_split(prop = 2 / 3)
df_train <- split |> training()
df_test <- split |> testing()best_model <- ranger(
formula = qOut ~ .,
data = df_train,
mtry = 1,
min.node.size = 2,
importance = "permutation"
)Le coefficient de détermination \(R^2\) associé à ce modèle de Random Forest est de 0.757, ce qui est similaire au score que nous avions obtenu précédemment.
Avec le graphique ci-dessous, nous pouvons comparer les valeurs prédites et les valeurs réelles. Lorsqu’un point est parfaitement aligné avec la ligne en pointillés rouge, le modèle fait la bonne prédiction. Cependant, si le point est au-dessus (resp. en-dessous) de la ligne, cela signifie que le modèle a sous-estimé (resp. surestimé) qOut.
Lorsque l’on examine l’importance des variables, on observe que la variable qLab exerce le plus grand impact dans le modèle de Random Forest, tandis que la variable qCap a le moins d’influence. C’est en effet assez intéressant car la variable qLab est systématiquement significative dans les modèles précédents.
En résumé, dans notre contexte, le Machine Learning ne semble pas apporter une valeur ajoutée significative. Le modèle obtenu n’est pas plus performant que les modèles précédents, et nous perdons l’avantage de disposer de coefficients associés à chaque variable.
6 Fonctions de coût
Une fonction de coût représente la relation entre les quantités des différents facteurs de production utilisés (ici
qCap,qLab,qMat) et le coût total de production (icivCap + vLab + vMat).
En fait, celle-ci donne le coût minimum associé à un niveau d’output et de prix des inputs, en tenant compte de la technologie disponible.
Calculons d’abord le coût total des inputs, c’est à dire \(v_{Cap} + v_{Lab} + v_{Mat}\).
apples <- apples |> mutate(cost = vCap + vLab + vMat)6.1 Fonction de coût Cobb-Douglas
\[ c_i = A \prod_{k=1}^{3} p_{ik}^{\alpha_k}q_i^{\alpha_y} \varepsilon_i \]
- Dans notre cas la fonction de coût Cobb-Douglas s’écrit :
\[ c_i = A \cdot q_{Out}^{\alpha_1} \cdot p_{Cap}^{\alpha_2} \cdot p_{Lab}^{\alpha_3} \cdot p_{Mat}^{\alpha_4} \cdot \epsilon_i \]
En linéarisant on obtient :
\[ \ln(c_i) = \ln(A) + \alpha_1 \cdot \ln(q_{out}) +\alpha_2 \cdot \ln(p_{Cap})+\alpha_3 \cdot \ln(p_{Lab})+\alpha_4 \cdot \ln(p_{Mat}) + \ln(\epsilon_i) \]
cobb_cost <- translogCostEst(
cName = "cost",
yName = "qOut",
pName = c("pCap", "pLab", "pMat"),
apples, homPrice = FALSE,
linear = TRUE
)| Fonction de coût Cobb Douglass | |||||
Variable dépendante : cost |
|||||
| Description | Coefficients | Ecart Type | Pvalues | Significativité | |
|---|---|---|---|---|---|
\(A\) |
|
6.754 | +/- 0.407 | 0 | \(***\) |
\(\alpha_1\) |
|
0.373 | +/- 0.031 | 0 | \(***\) |
\(\alpha_2\) |
|
0.074 | +/- 0.049 | 0.13 | |
\(\alpha_3\) |
|
0.465 | +/- 0.147 | 0.002 | \(**\) |
\(\alpha_4\) |
|
0.486 | +/- 0.081 | 0 | \(***\) |
| Observations : 140 | |||||
| |
|||||
| \(R^2=\) 0.688 | |||||
| \(R^2_{adj}=\) 0.679 | |||||
Le coefficient de 0.373 pour
qOutsignifie que si la production augmente de 1%, le coût total augmentera de 0.373%, ceteris paribus.Le coefficient de
pLabest de 0.464. Cela indique qu’une augmentation d’1% du prix du travail cela entraine une augmentation d’environ 0.464% du coût total, ceteris paribus.Le coefficient de
pMatest de 0.486. Il indique qu’une augmentation d’1% du prix des matériaux entraine une augmentation d’environ 0.486% du coût total, ceteris paribus.
Seul le coefficient associé à la variable pCap n’est pas significatif, les autres le sont à 5 % et 10 % pour pLab.
6.2 Fonction de coût Cobb-Douglas de court terme
La fonction de court terme est elle définie par l’immutabilité d’au moins un facteur de production. Dans notre contexte, le capital est fixe, ce qui nous permet de la caractériser ainsi.
\[ c_i = A x_{i3}^{\alpha_f}\prod_{k=1}^{2} p_{ik}^{\alpha_k}q_i^{\alpha_y} \varepsilon_i \]
- Dans notre cas la fonction de coût Cobb-Douglas de court terme s’écrit :
\[ c_i = A \cdot q_{Out}^{\alpha_1} \cdot q_{Cap}^{\alpha_4} \cdot p_{Lab}^{\alpha_2} \cdot p_{Mat}^{\alpha_3} \cdot \epsilon_i \]
En linéarisant on obtient :
\[ \ln(c_i) = \ln(A) + \alpha_1 \cdot \ln(q_{out}) +\alpha_4 \cdot \ln(q_{Cap})+\alpha_2 \cdot \ln(p_{Lab})+\alpha_3 \cdot \ln(p_{Mat}) + \ln(\epsilon_i) \]
cobb_cost_ct <- translogCostEst(
cName = "cost",
yName = "qOut",
pName = c("pLab", "pMat"),
fNames = "qCap",
data = apples,
homPrice = FALSE,
linear = TRUE
)| Fonction de coût Cobb Douglass de court terme | |||||
Variable dépendante : cost |
|||||
| Description | Coefficients | Ecart Type | Pvalues | Significativité | |
|---|---|---|---|---|---|
\(A\) |
|
5.603 | +/- 0.404 | 0 | \(***\) |
\(\alpha_1\) |
|
0.279 | +/- 0.032 | 0 | \(***\) |
\(\alpha_2\) |
|
0.402 | +/- 0.131 | 0.003 | \(**\) |
\(\alpha_3\) |
|
0.413 | +/- 0.073 | 0 | \(***\) |
\(\alpha_4\) |
|
0.237 | +/- 0.038 | 0 | \(***\) |
| Observations : 140 | |||||
| |
|||||
| \(R^2=\) 0.753 | |||||
| \(R^2_{adj}=\) 0.746 | |||||
Le coefficient de 0.279 pour
qOutsignifie que si la production augmente de 1%, le coût de augmentera de 0.279%, toutes choses étant égales par ailleurs. On remarque donc que à court terme la variation de la quantité produite à moins d’impact sur le coût que à long terme.Le coefficient de la variable
qCapest de 0.237, cela indique qu’une augmentation de 1% de la quantité de capital entraine une augmentation de 0.237% du coût total. A court terme, la quantité de capital a un impact positif et significatif sur le coût de production.Les prix du travail (
pLab) et des matériaux (pMat) ont un impact moins important sur le coût total à court terme que à long terme, on le remarque car les coefficients sont moins élevés à court terme.
6.3 Fonction de coût Translog
\[ \begin{gathered} \ln(c_i) = \alpha + \sum_{k=1}^3 \beta_k \ln(p_{ik}) + \alpha_q \ln(q_i) \\ +\frac{1}{2}\sum_{l=1}^3\sum_{k=1}^3\beta_{kl}\ln(p_{ik})\ln(p_{il})\frac{1}{2}\alpha_{q}(\ln(q_i))^2 \\ +\frac{1}{2}\sum_{k=1}^3\alpha_{kq}\ln(p_{ik})\ln(q_i)+\varepsilon_i \end{gathered} \]
- Dans notre cas la fonction de coût Translog s’écrit :
\[ \begin{gathered}\ln(c_{i}) =\alpha+\beta_2 \ln(p_{Cap})+\beta_3 \ln(p_{Lab})+\beta_4 \ln(p_{Mat}) + \beta_1\ln(q_{Out}) + \left[\frac{1}{4}\beta_{11}(\ln(q_{Out}))^2\right] \\ [(\beta_{22}\ln(p^2_{Cap})+\beta_{33}\ln(p^2_{Lab})+\beta_{44}\ln(p^2_{Mat}) +\beta_{23}\ln(p_{Cap}p_{Lab})+\beta_{24}\ln(p_{Cap}p_{Mat})+\beta_{34}\ln(p_{Lab}p_{Mat})] + \\ \frac{1}{2}[\beta_{12}\ln(p_{Cap})\ln(q_{Out})+ \beta_{13}\ln(p_{Lab})\ln(q_{Out}) + \beta_{14}\ln(p_{Mat})\ln(q_{Out})]+\varepsilon_i \end{gathered} \]
translog_cost <- translogCostEst(
cName = "cost",
yName = "qOut",
pName = c("pCap", "pLab", "pMat"),
apples, homPrice = FALSE
)| Fonction de coût Translog | |||||
Variable dépendante : cost |
|||||
| Description | Coefficients | Ecart Type | Pvalues | Significativité | |
|---|---|---|---|---|---|
\(\alpha\) |
|
25.383 | +/- 3.511 | 0 | \(***\) |
\(\beta_1\) |
|
−2.04 | +/- 0.511 | 0 | \(***\) |
\(\beta_2\) |
|
0.199 | +/- 0.538 | 0.712 | |
\(\beta_3\) |
|
−0.025 | +/- 2.232 | 0.991 | |
\(\beta_4\) |
|
−1.245 | +/- 1.201 | 0.302 | |
\(\beta_{11}\) |
|
0.164 | +/- 0.041 | 0 | \(***\) |
\(\beta_{12}\) |
|
−0.028 | +/- 0.043 | 0.513 | |
\(\beta_{13}\) |
|
0.008 | +/- 0.171 | 0.965 | |
\(\beta_{14}\) |
|
0.049 | +/- 0.092 | 0.598 | |
\(\beta_{22}\) |
|
−0.095 | +/- 0.105 | 0.367 | |
\(\beta_{23}\) |
|
−0.746 | +/- 0.244 | 0.003 | \(**\) |
\(\beta_{24}\) |
|
0.182 | +/- 0.13 | 0.165 | |
\(\beta_{33}\) |
|
−0.503 | +/- 0.943 | 0.595 | |
\(\beta_{34}\) |
|
0.139 | +/- 0.433 | 0.748 | |
\(\beta_{44}\) |
|
0.529 | +/- 0.338 | 0.12 | |
| Observations : 140 | |||||
| |
|||||
| \(R^2=\) 0.768 | |||||
| \(R^2_{adj}=\) 0.742 | |||||
- On remarque qu’avec une fonction de coût Translog, le coût dépend majoritairement de la quantité produite, on le constate avec la significativité des coefficients associés à
qOutetqOut^2.
7 Profit des producteurs
\[ \pi = (p_{Out} \cdot q_{Out}) - \overbrace{(v_{Cap} + v_{Lab} + v_{Mat})}^{cost} \]
apples <- apples |> mutate(profit = (pOut * qOut) - cost)Les producteurs dont le profit dépasse 5 millions sont mis en surbrillance verte.
Les producteurs dont le profit est négatif sont en mis subrillance rouge.
On remarque tout de même qu’il y a d’importantes différences de profits entre les producteurs.
En effet, il y a 14 producteurs de pommes ayant un profit négatif et 20 producteurs dont le profit est supérieur à 5 millions.
Le profit moyen \(\bar\pi\) quant à lui est de 2957490.
Le profit médian \(\tilde\pi\), bien inférieur, est de 862843.6.
Enfin, le producteur 53 possède le profit le moins elevé du panel et le producteur 129 possède le profit le plus elevé (voir le tableau ci-dessus).
On remarque quelque chose d’intéressant : la médiane des profits des producteurs recevant des conseils est bien plus élevée (1049160) que ceux ne recevant pas de conseils (709112.3)
Nous pouvons aussi nous intéresser au nuage de points des profits et des quantités produites.
Note : Etant donné la corrélation de 0.91 entre profit et qOut, on s’attend évidemment à ce que produire plus de pommes entraîne nécessairement un acroissement du profit.
8 Coût moyen
Le coût moyen représente le coût total (cost) de la firme divisé par son niveau d’output (qOut).
apples <- apples |> mutate(CM = cost / qOut)On constate que le coût moyen diminue considérablement au début, puis se stabilise à mesure que la quantité produite augmente.
On va sur ce graphique analyser la différence entre le coût moyen et le coût marginal. Le coût marginal que nous utilisons est celui calculé en Section 5.4.1. Selon Harnay (2024), toutes les valeurs négatives démontrent donc que les producteurs ont un coût marginal croissant, tandis que si la valeur est positive sur ce graphe, cela signifie que le producteur a un coût marginal décroissant. On constate que la majorité des producteurs ont un coût marginal décroissant.
On peut également tracer les courbes correspondant à la recette totale (RT) et au coût total (CT). La relation entre RT et la quantité produite est estimée de manière quadratique alors que la relation entre le CT et la quantité produite est une relation linéaire. Les points correspondent aux données réelles. On constate que le profit est dans un premier temps négatif puis devient positif (partie grisée). Ce petit modèle permet de constater à partir de quelle quantité produite un arboriculteur commence à faire du profit.
On remarque aussi visuellement les rendements d’échelle croissants
8.1 Fonction de profit Quadratique Normalisée Symétrique
Using the netput notation (where outputs are positive and inputs are treated as negative)
Code
apples_snq <- apples |>
select(N, pOut, pCap, pLab, pMat, qOut, qCap, qLab, qMat) |>
mutate(qCap = -qCap, qLab = -qLab, qMat = -qMat)
snq_func <- snqProfitEst(
priceNames = c("pOut", "pCap", "pLab", "pMat"),
quantNames = c("qOut", "qCap", "qLab", "qMat"),
data = apples_snq,
)
snq_func_convex <- snqProfitImposeConvexity(snq_func)
snq_func_convex
Estimation results of the SNQ profit function with convexityimposed:
Functional form: default (0)
Minimum distance estimation:
convergence achieved after 3453 iterations
Estimated coefficients:
[,1]
alpha 1 1748702.58
alpha 2 -160924.34
alpha 3 -224306.97
alpha 4 -289378.83
beta 1 1 117464.37
beta 1 2 -41896.70
beta 1 3 -116568.20
beta 1 4 41000.53
beta 2 1 -41896.70
beta 2 2 200686.01
beta 2 3 -63907.70
beta 2 4 -94881.61
beta 3 1 -116568.20
beta 3 2 -63907.70
beta 3 3 175584.57
beta 3 4 4891.33
beta 4 1 41000.53
beta 4 2 -94881.61
beta 4 3 4891.33
beta 4 4 48989.75
R-squared values of the netput equations:
qOut qCap qLab qMat
0.0150292 0.1733586 0.0733625 -0.0520413
Price elasticities of the netputs:
pOut pCap pLab pMat
qOut 0.0492708 0.00321733 -0.05511928 0.00263113
qCap -0.0676399 -0.32727973 0.18741720 0.20750241
qLab 0.6211974 0.10046807 -0.71566764 -0.00599782
qMat -0.0370740 0.13907336 -0.00749887 -0.09450044
Code
predict(snq_func_convex) qOut qCap qLab qMat profit
1 1748703 -160924.34 -224306.97 -289378.8 1074092.4
2 1741133 -80552.17 -280194.15 -325723.6 1315562.5
3 1767492 -159806.95 -249303.09 -286213.0 1987514.3
4 1638685 -209788.56 -106654.38 -290014.5 1098917.5
5 1763917 -283004.21 -208990.64 -233925.5 1702870.4
6 1802891 -269139.33 -273669.21 -232393.9 3148826.9
7 1797789 -263744.52 -263014.85 -235663.7 3012451.2
8 1729856 -254856.30 -171306.52 -252632.6 1201097.5
9 1811305 -191492.01 -311491.33 -264185.1 4528383.0
10 1754548 -251012.97 -199330.77 -249453.2 894607.9
11 1745571 -222826.68 -194958.12 -263311.6 1501320.0
12 1717767 -267156.94 -157557.22 -249730.3 1376833.9
13 1793183 -195009.69 -270688.47 -266072.4 2434938.8
14 1744170 -283700.14 -184343.02 -237469.2 1620287.4
15 1709857 -267688.68 -149950.38 -251058.0 1625312.7
16 1804655 -231450.75 -280376.67 -248212.2 4020798.0
17 1606942 -198458.40 -89640.81 -301203.8 957061.9
18 1754621 -334796.82 -203375.69 -213613.5 973975.1
19 1714165 -305915.58 -152212.76 -233838.5 1865894.3
20 1796976 -233581.73 -264658.93 -248749.2 2718340.5
21 1753557 -310151.98 -197178.33 -224331.5 1523412.1
22 1805116 -243500.42 -279289.64 -242953.8 2957006.2
23 1797239 -221316.67 -268196.43 -253970.1 1934893.4
24 1743992 -301326.98 -184468.72 -229963.2 1132009.8
25 1785270 -237408.29 -243810.10 -249343.4 1831086.3
26 1785799 -201457.54 -255327.72 -264704.5 1889000.9
27 1756915 -270780.31 -200173.32 -240518.2 1317659.7
28 1734333 -240025.35 -178639.71 -258121.1 1221973.0
29 1727105 -266440.38 -166951.89 -248203.8 1780316.5
30 1780138 -212631.67 -242423.65 -260981.3 1597393.0
31 1766140 -276408.80 -212002.42 -236317.1 1381644.8
32 1732177 -61344.48 -290155.30 -335840.0 1582265.0
33 1799273 -134962.18 -329337.96 -290957.5 3784147.9
34 1711736 -281353.46 -150416.83 -244831.2 900802.5
35 1775808 -221267.82 -233429.81 -258101.7 901118.0
36 1606688 -241460.21 -76491.74 -282757.1 992734.6
37 1723978 -303373.38 -162198.43 -233000.8 1723869.4
38 1761216 -189346.93 -225394.07 -274675.1 1670383.3
39 1812886 -257730.27 -297166.80 -235412.5 4020804.4
40 1740919 -332855.07 -184802.30 -217099.4 1402761.6
41 1822330 -235526.22 -327938.33 -243215.9 6366250.4
42 1806089 -277250.57 -281830.29 -228331.1 2849016.7
43 1734972 -279541.50 -174174.01 -241047.7 1163788.8
44 1810440 -268668.86 -291494.49 -231188.1 5491887.8
45 1746470 -285951.98 -187006.41 -236056.5 1540964.3
46 1674344 -300907.38 -116188.62 -243828.4 973119.8
47 1698507 -270715.49 -139241.67 -251996.1 1004155.1
48 1688958 -257550.47 -132874.80 -259528.2 1037990.7
49 1677937 -370838.20 -125000.01 -213234.9 1178865.4
50 1736543 -268078.14 -176714.00 -245652.0 1158212.0
51 1696438 -312362.98 -135355.73 -234566.4 1052901.5
52 1723798 -280718.78 -162358.93 -242733.4 1586865.7
53 1722625 -223509.36 -170819.39 -267516.2 1558048.4
54 1721080 -178612.31 -185598.11 -287152.3 1625471.4
55 1792531 -238577.98 -255683.43 -247450.7 1770293.0
56 1731333 -320334.87 -171439.79 -224311.9 917509.7
57 1713369 -285711.06 -151720.84 -242643.3 1790143.4
58 1592953 -443351.58 -71584.78 -199121.5 960243.6
59 1779049 -292154.13 -231728.54 -227094.2 1944990.0
60 1764422 -276636.55 -209675.81 -236552.6 1352518.6
61 1735247 -284547.33 -174271.94 -238850.4 1454442.9
62 1612306 -264302.75 -75192.73 -271828.3 907329.6
63 1774254 -271094.90 -223535.99 -237023.0 2031093.4
64 1809003 -239699.92 -288582.62 -243856.4 4752561.9
65 1752185 -238702.61 -198709.98 -255198.0 1062160.7
66 1810830 -267919.63 -292426.49 -231436.1 4736555.5
67 1760870 -313888.66 -207611.77 -221319.2 1637494.0
68 1745869 -311456.03 -187593.76 -225269.0 2019262.9
69 1808537 -240552.47 -287367.86 -243577.6 4367489.4
70 1725989 -372531.24 -177320.32 -203106.5 1878822.6
71 1802654 -259073.21 -272926.27 -236744.5 2450762.0
72 1712961 -272203.59 -152376.29 -248511.6 1106976.8
73 1810673 -249729.09 -291576.96 -239246.2 3604357.8
74 1723664 -75442.47 -262076.10 -331335.5 2022014.1
75 1773270 -179097.20 -246577.47 -276761.3 1842979.5
76 1692471 -245943.22 -138026.16 -263817.6 1628550.0
77 1726597 -150237.01 -205818.55 -298319.3 1651090.1
78 1731194 -304269.53 -169987.68 -231204.6 1608880.8
79 1724594 -275347.21 -163543.06 -244878.6 1654998.9
80 1726604 -236102.55 -171582.22 -261322.3 1600282.5
81 1684833 -249258.29 -130952.62 -263902.8 1215789.6
82 1731286 -228659.81 -178117.41 -263601.6 1777330.9
83 1707431 -317510.68 -146027.23 -230202.6 2378666.6
84 1737308 -275908.88 -176929.27 -242146.7 1292931.0
85 1761400 -282663.22 -205628.19 -234559.4 1614753.9
86 1763955 -304865.23 -210602.43 -224574.3 1436851.2
87 1777353 -254382.08 -229178.11 -243585.1 2558855.1
88 1762050 -323962.99 -211317.88 -216794.9 2085517.0
89 1821511 -230099.08 -325960.55 -245690.8 3728633.7
90 1780143 -302999.26 -235121.81 -222255.1 2163907.6
91 1687789 -346739.98 -130061.08 -221578.1 1315171.2
92 1754804 -317290.07 -199866.68 -221042.4 1417433.7
93 1799792 -244992.92 -268126.74 -243317.7 2772802.5
94 1788771 -231050.67 -250821.72 -251402.4 2286526.3
95 1814502 -225476.04 -305376.37 -248946.1 4542109.7
96 1802319 -282166.06 -273913.78 -226937.5 4661204.8
97 1807372 -236699.09 -285305.90 -245448.8 2226016.4
98 1794472 -263455.55 -256715.68 -236416.9 2208840.1
99 1678238 -337754.70 -120356.40 -227297.5 1478239.0
100 1812123 -167525.83 -331930.21 -274423.9 7104257.2
101 1754795 -237831.36 -201989.39 -255063.3 1383656.8
102 1704874 -291668.02 -143359.55 -241763.1 1014743.5
103 1817646 -204945.08 -322350.23 -257216.0 5691647.4
104 1792769 -166576.22 -286158.09 -278437.6 2387829.1
105 1818153 -214104.84 -319793.64 -253174.2 4651366.7
106 1772934 -275874.81 -221555.13 -235231.7 1636377.2
107 1738730 -230042.87 -185576.04 -261548.2 1594767.4
108 1775883 -295866.42 -227153.28 -226116.8 1720513.5
109 1695248 -319350.92 -134500.80 -231812.2 1217840.3
110 1799309 -273928.39 -266454.45 -231021.2 2430796.0
111 1753704 -309085.21 -197238.86 -224758.5 1186309.9
112 1714574 -253522.99 -156437.90 -256206.9 1120942.1
113 1762849 -247330.13 -210217.30 -249418.3 1664494.8
114 1743312 -318255.01 -185291.04 -222863.5 1403541.3
115 1577509 -377085.51 -47321.05 -230447.3 853852.5
116 1727085 -245733.45 -170054.13 -257091.8 1634578.9
117 1689999 -259514.76 -133431.10 -258479.6 927031.2
118 1783067 -196221.28 -253170.30 -267486.0 1761722.0
119 1724679 -223062.68 -172958.94 -267304.9 1098045.2
120 1707068 -331052.20 -146813.36 -224487.4 1674426.3
121 1770285 -113262.39 -291110.48 -305868.0 2379449.9
122 1770889 -256386.06 -219722.77 -243974.8 1946995.6
123 1772983 -166972.75 -252870.25 -282054.2 1799854.1
124 1644472 -259781.61 -97960.99 -267378.4 953224.0
125 1813580 -239920.48 -299980.49 -242913.1 4056678.5
126 1816339 -209469.17 -316215.66 -255501.4 6307020.2
127 1781171 -251219.53 -235274.29 -244205.5 1900855.4
128 1705666 -146078.66 -187598.01 -304228.5 863593.9
129 1821370 -219728.69 -328466.09 -250175.8 6800095.4
130 1719242 -301909.69 -157258.91 -234555.5 1725645.6
131 1611876 -350050.61 -68949.92 -235175.4 1097449.5
132 1820200 -203085.43 -331930.39 -257561.6 6031700.7
133 1806435 -243893.53 -282140.92 -242537.7 4133185.4
134 1815434 -216914.65 -310637.04 -252458.5 4607801.2
135 1713127 -314979.84 -151545.19 -230166.1 1573913.3
136 1693537 -198176.70 -152557.99 -284147.8 1298767.7
137 1751455 -314404.99 -195013.28 -222923.6 2278329.2
138 1783689 -244722.55 -240057.13 -246507.8 2865219.2
139 1824695 -259232.69 -338535.85 -232666.9 5902426.2
140 1777721 -220853.22 -236310.42 -257910.5 2150380.2
9 Infos sur le sujet | ROADMAP
\(\Rightarrow\) Estimer somehow la leontieff généralisée, vérifier hétéroscédasticité.
Propriété de la CD => si la fonction de prod est cobb douglas, alors la fonction de coût l’est aussi.
- Rendements d’échelle (somme des exposants) => on peut trouver ces rendements d’échelle soit en faisant la fonction de coût, ou la fonction de production. Mais on peut aussi les estimer grace à une fonction de demande
DEUX CHOSES ESSENTIELLES
- Il faut estimer les substitutions entre facteurs
- Les rendements d’échelle
9.1 Notes sur la translog Cost
On pourrait tt à fait estimer le système d’équations suivant :
Voir aussi la slide 78 sur la fonction \(\ln C\)
\[ \begin{cases} S_1 = \alpha_1 + \sum^3_{i=1} \beta_{1j}\ln p_j + \beta_{1y}\ln y\\ S_2 = \alpha_2 + \sum^3_{i=1} \beta_{2j}\ln p_j + \beta_{2y}\ln y\\ S_3 = \alpha_3 + \sum^3_{i=1} \beta_{3j}\ln p_j + \beta_{3y}\ln y \end{cases} \]
Inconvénients dans la translog et les formes flexibles :
Le nombre de paramètres explose à cause des effets croisés et risque important de collinéarité.
Quand on passe au système au tableau, on a augmenté à 3*140 données (420 observations) et on a un peu moins de paramètres
done